
#笔试题描述：
#有个xxx.csv文件，统计出现“今天”、“天气”、“真赞”的次数，并排序输出。
#我的思路：
#1、使用文件输入输出流按字节读取文件，设置编码为UTF-8（防止文件过大或者读取后是乱码）；
#2、前一个字符串和后一个字符串的首字符拼接，作为统计对象，进行遍历（防止出现前一个字符串是“今”，后一个字段串首字符是“天”）；
#3、统计一个字符串出现的次数：把原字符s进行替换，s.replace("今天"，“”)，比较替换后字符串长度，出现次数为（s.length-s1.length）/2;
#4、排序嘛方法比较多，不是重点。
#coding=utf-8

import re

str1=open('./xxx.csv',encoding='utf-8').read()  #读出文件

reword={'今天','天气','真赞'}  #列出要匹配文字
setreword={}            #初始化计数统计字典
for word in reword:     #基数统计
    count=0
    for i in re.finditer(word,str1): #全文匹配计数
        count=count+1
    setreword[word]=count    #设置字典
serewordorder=sorted(setreword.items(),key=lambda x:x[1])   #字典排序
print(setreword)  #打印结果

str1.close()